110 research outputs found

    Atelier "Systèmes d'Information et de Décision pour l'Environnement" (SIDE 2009)

    Get PDF
    National audienceLes Systèmes d'Information et les Systèmes d'Aide à la Décision représentent des solutions de plus en plus performantes pour relever les récents challenges concernant la gestion et l'analyse des données environnementales. Souvent, le recueil ou l'acquisition des données environnementales restent dans le domaine environnemental un vrai challenge car les techniques mises en oeuvre (ex : enquêtes) ou l'instrumentation déployée (ex : satellite) sont lourdes et onéreuses. Or cette activité de recueil et d'acquisition est essentielle car sans information pertinente et de qualité les Systèmes d'Information ou d'Aide à la Décision deviennent rapidement inopérants. L'objectif de l'atelier est de présenter les dernières avancées dans le domaine des Systèmes d'Information mais aussi de présenter des outils et des méthodes permettant d'acquérir ou d'extraire de l'information d'une part et de mettre en forme cette information pour alimenter un système d'information d'autre part. L'atelier est ouvert aussi bien à la présentation de travaux déjà appliqués au contexte de l'environnement, qu'à des réflexions plus prospectives sur les possibilités d'utilisation d'un produit de la recherche en informatique pour une application environnementale. La journée d'atelier a été découpée en trois sessions. La première présente des méthodes et des outils permettant de mettre en forme des données sur l'eau, la seconde s'intéresse aux systèmes et méthodes pour la gestion des territoires et la troisième concerne les systèmes d'aide à la décision. Un premier article présente un système informatique pour la collaboration interdisciplinaire basée sur une théorie sociologique appliquée à des problématiques liées à l'eau. Un autre travail propose l'intégration d'outils d'analyse multicritères dans un S.I.G couplé à des modèles pour l'évaluation du potentiel aquifère des bassins versants. D'autres travaux portent sur une méthodologie de traitement d'images pour répondre à des besoins de modélisation hydrologique à différentes échelles. Les techniques multicritères et de statistiques spatiales sont au centre de deux autres articles, l'un pour la valorisation des continuums écologiques et l'autre pour l'analyse du développement urbain. La gestion des risques environnementaux est abordée par des recherches sur une infrastructure logicielle d'intégration à base d'agents ; une application est faite à l'évolution de la carte du risque d'incendie de forêt. Un papier présente une nouvelle architecture d'un système d'information pour la géolocalisation des animaux pour la prévention des risques sanitaires. Un article traite de l'écoulement des eaux et des polluants à l'échelle du bassin versant et introduit une méthode incrémentale et interactive d'apprentissage. Un dernier article décrit un outil d'extraction de connaissances pour l'aide à la qualification de l'état des milieux aquatiques. La qualité des travaux laisse présager une journée d'atelier particulièrement enrichissante. Nous remercions par ailleurs tous les membres du comité de programme pour leur excellent travail ainsi que les auteurs des articles

    Towards a Multi-Model Approach to Support User-Driven Extensibility in Data Warehouses: Agro-ecology Case Study

    Get PDF
    Information systems have evolved into complex data platforms supporting end-to-end data-intensive needs, aimed at coping with the different V's that characterize Big Data. In particular, multi-model databases (MMDBs) have been proposed to natively support storing and querying data in different (schemaless) models, so as to better handle Variety. In this work we envision a new data warehouse architecture in which an MMDB is used to enable on-the-fly user-driven extensions of multidimensional cubes with additional data, while ensuring support to variable and complex data and keeping the impact on ETL low. After proposing the architecture with the aid of a case study on the management of emerging plant disease, we discuss the main associated open issues

    Une nouvelle approche mixte d'enrichissement de dimensions dans un schéma multidimensionnel en constellation Application à la biodiversité des oiseaux

    No full text
    International audienceLes entrepôts de données (DW) et les systèmes OLAP sont des technologies d'analyse en ligne pour de grands volumes de données, basés sur les be-soins des utilisateurs. Leur succès dépend essentiellement de la phase de conception où les exigences fonctionnelles sont confrontées aux sources de données (méthodologie de conception mixte). Cependant, les méthodes de conception existantes semblent parfois inefficaces, lorsque les décideurs définissent des exi-gences fonctionnelles qui ne peuvent être déduites à partir des sources de don-nées (approche centrée sur les données), ou lorsque le décideur n'a pas intégré tous ces besoins durant la phase de conception (approche centrée sur l'utilisa-teur). Cet article propose une nouvelle méthodologie mixte d'enrichissement de schémas en constellation, où l'approche classique de conception est améliorée grâce à la fouille de données dans le but de créer de nouvelles hiérarchies au sein d'une dimension. Un prototype associé est également présenté

    A New Relational Spatial OLAP Approach For Multi-resolution and Spatio-multidimensional Analysis of Incomplete Field Data

    Get PDF
    International audienceIntegrating continuous spatial data into SOLAP systems is a new research challenge. Moreover, representation of field data at different scales or resolutions is often mandatory for an effective analysis. Thus, in this paper, we propose a logical model to integrate spatial dimensions representing incomplete field data at different resolutions in a classical SOLAP architecture

    A UML Profile for Variety and Variability Awareness in Multidimensional Design: An application to Agricultural Robots

    Get PDF
    Variety and variability are an inherent source of information wealth in schemaless sources, and executing OLAP sessions on multidimensional data in their presence has recently become an object of research. However, all models devised so far propose a ``rigid'' view of the multidimensional content, without taking into account variety and variability. To fill this gap, in this paper we propose V-ICSOLAP, an extension of the ICSOLAP UML profile that supports extensibility and type/name variability for each multidimensional element, as well as complex data types for measures and levels. The real case study we use to motivate and illustrate our approach is that of trajectory analysis for agricultural robots. As a proof-of-concept for V-ICSOLAP, we propose an implementation that relies on the PostgreSQL multi-model DBMS and we evaluate its performances. We also provide a validation of our UML profile by ranking it against other meta-models based on a set of quality metrics

    Multidimensional modeling and analysis of large and complex watercourse data: an OLAP-based solution

    Get PDF
    International audienceThis paper presents the application of Data Warehouse (DW) and On-Line Analytical Processing (OLAP) technologies to the field of water quality assessment. The European Water Framework Directive (DCE, 2000) underlined the necessity of having operational tools to help in the interpretation of the complex and abundant information regarding running waters and their functioning. Several studies have exemplified the interest in DWs for integrating large volumes of data and in OLAP tools for data exploration and analysis. Based on free software tools, we propose an extensible relational OLAP system for the analysis of physicochemical and hydrobiological watercourse data. This system includes: (i) two data cubes; (ii) an Extract, Transform and Load (ETL) tool for data integration; and (iii) tools for OLAP exploration. Many examples of OLAP analysis (thematic, temporal, spatiotemporal, and multiscale) are provided. We have extended an existing framework with complex aggregate functions that are used to define complex analysis indicators. Additional analysis dimensions are also introduced to allow their calculation and also for purposes of rendering information. Finally, we propose two strategies to address the problem of summarizing heterogeneous measurement units by: (i) transforming source data at the ETL tier, and (ii) introducing an additional analysis dimension at the OLAP server tier

    Modèles de coût pour la sélection de vues matérialisées dans le nuage, application aux services Amazon EC2 et S3

    Get PDF
    National audienceDans les bases et entrepôts de données, la performance des requêtes est classiquement assurée grâce à des structures comme les caches, les index et les vues matérialisées. Dans ce contexte, des modèles de coût permettent de sélectionner un ensemble efficace de ce type de structures. Toutefois, cette tâche de sélection devient plus complexe dans le nuage, car en plus des temps de réponse, il faut simultanément optimiser le coût monétaire d'utilisation du nuage. En conséquence, nous proposons dans cet article de nouveaux modèles de coût qui intègrent le paradigme de paiement à la demande en vigueur dans les nuages informatiques. Sur la base de ces modèles, nous définissons un problème d'optimisation consistant à sélectionner, parmi un ensemble de vues candidates, celles qu'il faut matérialiser pour minimiser le coût d'interrogation et de maintenance de la base de données, ainsi que le temps de réponse à une charge de requêtes donnée. Dans un premier temps, nous optimisons les deux critères précédents séparément: le temps de réponse est optimisé sous contrainte de coût et vice versa. Les expériences que nous avons menées pour valider cette proposition montrent que la matérialisation de vues dans le nuage est toujours avantageuse

    Enrichissement de schéma multidimensionnel en constellation grâce à la Classification Ascendante Hiérarchique

    No full text
    National audienceLes hiérarchies sont des structures cruciales dans un entrepôt de don-nées puisqu'elles permettent l'agrégation de mesures dans le but de proposer une vue analytique plus ou moins globale sur les données entreposées, selon le niveau hiérarchique auquel on se place. Cependant, peu de travaux s'intéressent à la construction de hiérarchies, via un algorithme de fouille de données, pre-nant en compte le contexte multidimensionnel de la dimension concernée. Dans cet article, nous proposons donc un algorithme, implémenté sur une architecture ROLAP, permettant d'enrichir une dimension avec des données factuelles

    A System for Interactive Spatial Analysis via Potential Maps

    Get PDF
    International audienceThis paper presents a new cartographic tool for spatial analysis of social data, using the potential smoothing method. The purpose of this method is to view the spreading of a phenomenon (demographic, economical, social, etc.) in a continuous way, at a macroscopic scale, from data sampled on administrative areas. We aim to offer an interactive tool, accessible through the Web, but guarantying the confidentiality of data. The biggest difficulty is induced by the high complexity of the calculus, dealing with a great amount of data. A distributed architecture is proposed: map computation is made on server-side, using particular optimization techniques, whereas map visualization and parameterisation of the analysis are done on a web-based client, the two parts communicating through a Web protocol

    Guaranteeing the quality of multidimensional analysis in data warehouses of simulation results: application to pesticide transfer data produced by the MACRO Model

    Get PDF
    International audienceCurrently, the vital impact of environmental pollution on economic, social and health dimensions has been recognized. The need for theoretical and implementation frameworks for the acquisition, modeling and analysis of environmental data as well as tools to conceive and validate scenarios is becoming increasingly important. For these reasons, different environmental simulation models have been developed. Researchers and stakeholders need efficient tools to store, display, compare and analyze data that are produced by simulation models. One common way to manage simulation results is to use text files; however, text files make it difficult to explore the data. Spreadsheet tools (e.g., OpenOffice, MS Excel) can help to display and analyze model results, but they are not suitable for very large volumes of information. Recently, some studies have shown the feasibility of using Data Warehouse (DW) and On-Line Analytical Processing (OLAP) technologies to store model results and to facilitate model visualization, analysis and comparisons. These technologies allow model users to easily produce graphical reports and charts. In this paper, we address the analysis of pesticide transfer simulation results by warehousing and OLAPing data, for which the data results from the MACRO simulation model. This model simulates hydrological transfers of pesticides at the plot scale. We demonstrate how the simulation results can be managed using DW technologies. We also demonstrate how the use of integrity constraints can improve OLAP analysis. These constraints are used to maintain the quality of the warehoused data as well as to maintain the aggregations and queries, which will lead to better analysis, conclusions and decisions
    • …
    corecore